APU، سيستم پردازشي با قابليتهاي اضافي
APU، سيستم پردازشي با قابليتهاي اضافي
APU، سيستم پردازشي با قابليتهاي اضافي
AMD هرگز نتوانسته در زمينه حجم فروش CPU بر اينتل غلبه پيدا كند. با اينحال، واقعيت مذكور به هيچوجه به معناي آن نيست كه شركت AMD نقش ثانويهاي را در دنياي پردازندههاي x86 ايفا ميكند. در واقع بارها اتفاق افتاده كه نوآوريهاي اين شركت در زمينه توسعه معماري ريزپردازندههاي x86 خودش در نهايت به يك گرايش بازاري در سطح جهان تبديل شده و حتي اينتل نيز چارهاي جز پذيرش آنها نداشته است. در واقع اين AMD بود كه ضمايم 64 بيتي را براي معماري x86 توسعه داد و در عين حال اولين توليدكنندهاي بود كه آنها را در محصولات واقعي پيادهسازي كرد. حالا همين ضمايم به يك بخش جدايي ناپذير از معماري ريزپردازندهها تبديل شدهاند. همچنين، AMD اولين شركتي بود كه ايده ادغام پردازنده و پل شمالي چيپست را مطرح كرد و همچنين اولين توليدكنندهاي بود كه كنترلر حافظه را به داخل پردازنده انتقال داد. تمام اين موارد و بسياري مثالهاي ديگر نشان ميدهند كه دومين توليدكننده بزرگ بازار ريزپردازندهها اصلا در حاشيه قرار نگرفته، بلكه پتانسيل تكنولوژيكي و مهندسي عظيمي را نيز به نمايش ميگذارد.
چند سال پيش، اين پتانسيل با تصاحب شركت ATI Technologies تقويت شد و دسترسي به فناوريهاي صدرنشين گرافيكي را در اختيار AMD قرار داد. اين فناوريها به AMD كمك كردند تا به نوآوريهاي چشمگيرتري دست پيدا كند كه APU يكي از آنها است. APU يا Accelerated Processing Unit كه در ابتدا بهعنوان يك اصطلاح عمومي مورد استفاده قرار ميگرفت، يك سيستم پردازشي با قابليتهاي اضافي است كه براي شتابدهي يك يا چند نوع از محاسبات خارج از يك CPU طراحي شده است. امروزه بيشتر APUها بهعنوان يك ابزار پردازشي توصيف ميشوند كه در آنها يك CPU و GPU روي يك die واحد تركيب شدهاند. اين تركيب، نرخ انتقال داده مابين مولفههاي مذكور را بهبود بخشيده و در عين حال مصرف برق كلي سيستم را كاهش ميدهد. APUها در عين حال ميتوانند شامل شتابدهندههاي پردازش ويديويي يا ساير شتابدهندهها با كاربردهاي خاص باشند. AMD Fusion، IBM CELL و Intel HD Graphics همگي مثالهايي از APUها بهشمار ميآيند. ما در اين مقاله به بحث در مورد AMD Fusion خواهيم پرداخت.
همانطور كه توضيح داديم، ايده پشت Fusion شامل تركيب هستههاي محاسباتي سنتي با يك هسته گرافيكي است كه انبوهي از پردازندههاي جريان با قابليت پردازش كارامد محاسبات موازي را در بر ميگيرد. اين روزها يك پردازنده با هسته گرافيكي مجتمع به هيچوجه يك موضوع غافلگير كننده بهشمار نميآيد. در واقع اينتل مدتي است كه چنين محصولاتي را روانه بازار كرده است.با اينحال، AMD يك روش متفاوت را براي همزيستي هستههاي محاسباتي و گرافيكي انتخاب كرده. به گفته مهندسين اين شركت، هسته گرافيكي صرفا نبايد مسئوليت نمايش تصوير روي مانيتور را بر عهده داشته باشد. در واقع اين هسته در عين حال بايد با توابع عمومي پردازنده نيز درگير شود.
معماري هستههاي گرافيكي معاصر به آنها امكان ميدهد تا آرايههاي بزرگي از دادهها را بهطور موازي پردازش كنند. بنابراين، ذخيره محاسباتي هسته گرافيكي قادر است بهطور كارامدي در وظايف مختلف نظير پردازش تصوير و ويديو، الگوريتمهاي رمزنگاري و حل مسايل علمي درگير شود. البته فرآيند مذكور مستلزم آن است كه نرمافزارهاي موجود بهطور صحيحي بهينهسازي شوند.اولين نسل از محصولات مبتني بر مفهوم Fusion مدتي است كه روانه بازار شدهاند. در واقع پردازندههايي كه با اسامي رمز Ontario و Zacate شناخته ميشوند و به سريهاي E و C محصولات AMD تعلق دارند، كارايي خود را در سيستمهاي موبايل و دسكتاپ ارزانقيمت مبتني بر پلتفرم Brazos به اثبات رساندهاند. با اينحال، پردازندههاي مذكور در اصل براي سيستمهاي فشرده و كممصرف در نظر گرفته شده بودند و به همين دليل عملكرد نسبتا پايين را با حوزههاي كاربرد بسيار محدود ارايه ميكردند. كاملا واضح است كه AMD براي آنكه بتواند مفهوم Fusion را به يك پذيرش جهاني برساند، به پلتفرمها و پردازندههاي عمومي بيشتري با سطح عملكرد مناسب در اين بازار نياز دارد. بنابراين، AMD پس از Brazos دو پلتفرم جديد Fusion را معرفي كرد: Sabine موبايل و Lynx دسكتاپ. هر دو پلتفرم مذكور مبتني بر پردازندههاي جديد سري A هستند كه با اسم رمز Llano شناخته ميشوند. قرار است Llano يكي از مدافعان اصلي شهرت Fusion در بازار پردازندههاي عمومي باشد.اجازه بدهيد نگاه دقيقتري به اولين پردازندههاي Llano انداخته و ببينيم آيا ما همانقدر كه AMD پافشاري ميكند به يك معماري پيوندي انقلابي نياز داريم يا خير.
از سوي ديگر، با وجود آنكه Llano دومين پردازنده در خانواده Fusion بهشمار ميآيد، اما ساختار كلي اين پردازنده تنها نكته جديد درباره آن است. بهعبارت ديگر، كل APU جديد صرفا با استفاده از مولفههاي قديمي و با حداقل نوآوري تركيب شده است. اگر قرار بود اين محصول جديد را بدون بحث عميق در مورد ويژگيهاي آن توصيف كنيم، ميتوانستيم بگوييم كه Llano تركيبي از يك پردازنده Athlon II X4، هسته گرافيكي Radeon HD 5570 و چيپست AMD 870 است كه در داخل يك بستهبندي مشترك روي يك die نيمههادي واحد قرار گرفتهاند. البته اين توضيح كاملا نسبي است زيرا پردازنده جديد Llano از نوآوريهاي محدود و پيادهسازيهاي فني منحصربهفردي را نيز به همراه دارد، اما بهطور كلي هيچ نكته جديدي در اين APU به چشم نميخورد.
در عين حال، مهندسين AMD تلاش كردهاند تا ريزمعماري جديد خود را از بعضي جنبهها نوسازي كرده و عملكرد هستههاي Husky را حداقل نسبت به هستههاي داخل پردازندههاي Athlon II و Phenom II بهبود بخشند. واقعيت اين است كه دستيابي به اين هدف بسيار آسان بوده: صرفا با افزايش حافظه كاشه L2. به اين ترتيب، اكنون هر يك از هستههاي Llano به يك كاشه L2 يك مگابايتي مخصوص خودش مجهز شده. با اينحال، پردازنده جديد مطلقا فاقد كاشه L3 اشتراكي خواهد بود و به همين دليل مجموعه اندازه حافظه كاشه آن بر اساس استانداردهاي امروزي چندان بزرگ به نظر نميرسد.گذشته از افزايش كاشه، هستههاي Husky داراي يك واحد پيشبيني انشعاب بهبود يافته و بافرهاي اصلي بهينهسازي شده هستند: بافر بازچيني دستورالعملها اكنون 20 درصد بزرگتر شده و اندازه بافرهاي Load/Store نيز تا دو برابر افزايش پيدا كرده. بهعلاوه، Husky داراي يك مقسم (Divider) سختافزاري جداگانه است كه عمليات متناظر با آن را شتابدهي خواهد كرد. همانطور كه ميبينيد، تغييرات چنداني در ساختار پردازنده اعمال نشده است. پايه معماري K10 كاملا بدون تغيير باقي مانده و به همين دليل است كه Husky نميتواند چيزي بيش از 3 دستورالعمل را در هر سيكل كلاك خود پردازش كند (درست مثل تمام هستههاي قبلي).
تغييراتي كه در بالا به آنها اشاره كرديم، به AMD امكان ميدهند تا از يك نام بازاري سري 6000 براي هسته گرافيكي Sumo خود استفاده كند. بنابراين بر حسب تعداد پردازندههاي جريان داخلي، Llano ميتواند به يك Radeon HD 6550D يا Radeon HD 6530D مجهز شده باشد.وجود يك معادل مجتمع از كارت گرافيكي Radeon 5570 ميتواند ويژگي وسوسهانگيزي باشد، اما براي همه مناسب نخواهد بود. بنابراين AMD امكان ارتقاي شتابدهنده داخلي APU خود با بهرهگيري از فناوري CrossFire را فراهم كرده است. در اين حالت، فناوري مذكور تحت عنوان Dual Graphics شناخته ميشود و امكان تركيب GPU مجتمع با يك كارت گرافيكي Radeon الحاقي را براي ايجاد يك پيكربندي نامتقارن CrossFire بهوجود ميآورد.
اين فناوري واقعا تاثيرگذار است زيرا يك سيستم Dual Graphics ميتواند يك كارت گرافيكي از هر نوعي را بپذيرد. با اينحال، اين تنوعپذيري با مشكلاتي نيز همراه خواهد بود. پيش از هر چيز، شما تنها در صورتي ميتوانيد عملكرد گرافيكي خود را بهبود بخشيد كه شتابدهنده الحاقي بيش از دو برابر سريعتر از هسته Sumo مجتمع APU مورد استفادهتان نباشد. بهعبارت ديگر، اگر يك Radeon HD 6850 داشته باشيد، استفاده از آن بهعنوان يك كارت الحاقي مستقل و غيرفعال كردن هسته گرافيكي مجتمع بهطور كامل، بسيار منطقيتر به نظر ميرسد. محدوديت دوم حتي از اين نيز جديتر است. حالتهاي نامتقارن CrossFire تنها در DirectX 10/11 كار ميكنند و به همين دليل Dual Graphics در بازيهاي مبتني بر DirectX 9 يا OpenGL نه تنها هيچ مزيتي را به همراه نخواهد داشت، بلكه عملكرد تا سطح كندترين GPU سيستم تنزل خواهد كرد. با اينحال، Dual Graphics يك شيوه عالي براي صرفهجويي در هزينهها را در اختيار كاربران قرار ميدهد كه باعث ميشود Llano به يك گزينه فوقالعاده براي سيستمهاي بازي سطح پايين تبديل گردد.
هسته گرافيكي بهوضوح به پهناي باند بالايي از گذرگاه حافظه نياز دارد. حتي خود AMD نيز به اين نكته اشاره ميكند كه استفاده از حافظه DDR3-1333 ميتواند عملكرد هسته گرافيكي مجتمع را بهطور چشمگيري كاهش دهد. با اينحال، پشتيباني از حافظه سريع بهعنوان خصوصيت اصلي پل شمالي در نظر گرفته نميشود. نكته بسيار جالبتر درباره اين پل شمالي، مسيرهاي داده جديد آن هستند كه عملكرد مولفههاي گرافيكي APU را بهينهسازي ميكنند. در كنار لينك سنتي مابين CPU و پل شمالي، Llano داراي دو اتصال گذرگاه اضافي مابين GPU و پل شمالي خود است.اتصال اول كه تحت عنوان Radeon Memory Bus شناخته ميشود، براي كاربردهاي گرافيكي عمومي مورد استفاده قرار ميگيرد. پهناي باند اين گذرگاه معادل 29,8 گيگابيت بر ثانيه است كه مشابه نرخ انتقال داده حافظههاي DDR3-1866 خواهد بود. درخواستهاي حافظهاي كه از اين گذرگاه عبور ميكنند داراي بالاترين اولويت هستند و كنترلر حافظه آنها را حتي پيش از درخواستهاي پردازنده پاسخ ميدهد.
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb
چند سال پيش، اين پتانسيل با تصاحب شركت ATI Technologies تقويت شد و دسترسي به فناوريهاي صدرنشين گرافيكي را در اختيار AMD قرار داد. اين فناوريها به AMD كمك كردند تا به نوآوريهاي چشمگيرتري دست پيدا كند كه APU يكي از آنها است. APU يا Accelerated Processing Unit كه در ابتدا بهعنوان يك اصطلاح عمومي مورد استفاده قرار ميگرفت، يك سيستم پردازشي با قابليتهاي اضافي است كه براي شتابدهي يك يا چند نوع از محاسبات خارج از يك CPU طراحي شده است. امروزه بيشتر APUها بهعنوان يك ابزار پردازشي توصيف ميشوند كه در آنها يك CPU و GPU روي يك die واحد تركيب شدهاند. اين تركيب، نرخ انتقال داده مابين مولفههاي مذكور را بهبود بخشيده و در عين حال مصرف برق كلي سيستم را كاهش ميدهد. APUها در عين حال ميتوانند شامل شتابدهندههاي پردازش ويديويي يا ساير شتابدهندهها با كاربردهاي خاص باشند. AMD Fusion، IBM CELL و Intel HD Graphics همگي مثالهايي از APUها بهشمار ميآيند. ما در اين مقاله به بحث در مورد AMD Fusion خواهيم پرداخت.
همانطور كه توضيح داديم، ايده پشت Fusion شامل تركيب هستههاي محاسباتي سنتي با يك هسته گرافيكي است كه انبوهي از پردازندههاي جريان با قابليت پردازش كارامد محاسبات موازي را در بر ميگيرد. اين روزها يك پردازنده با هسته گرافيكي مجتمع به هيچوجه يك موضوع غافلگير كننده بهشمار نميآيد. در واقع اينتل مدتي است كه چنين محصولاتي را روانه بازار كرده است.با اينحال، AMD يك روش متفاوت را براي همزيستي هستههاي محاسباتي و گرافيكي انتخاب كرده. به گفته مهندسين اين شركت، هسته گرافيكي صرفا نبايد مسئوليت نمايش تصوير روي مانيتور را بر عهده داشته باشد. در واقع اين هسته در عين حال بايد با توابع عمومي پردازنده نيز درگير شود.
معماري هستههاي گرافيكي معاصر به آنها امكان ميدهد تا آرايههاي بزرگي از دادهها را بهطور موازي پردازش كنند. بنابراين، ذخيره محاسباتي هسته گرافيكي قادر است بهطور كارامدي در وظايف مختلف نظير پردازش تصوير و ويديو، الگوريتمهاي رمزنگاري و حل مسايل علمي درگير شود. البته فرآيند مذكور مستلزم آن است كه نرمافزارهاي موجود بهطور صحيحي بهينهسازي شوند.اولين نسل از محصولات مبتني بر مفهوم Fusion مدتي است كه روانه بازار شدهاند. در واقع پردازندههايي كه با اسامي رمز Ontario و Zacate شناخته ميشوند و به سريهاي E و C محصولات AMD تعلق دارند، كارايي خود را در سيستمهاي موبايل و دسكتاپ ارزانقيمت مبتني بر پلتفرم Brazos به اثبات رساندهاند. با اينحال، پردازندههاي مذكور در اصل براي سيستمهاي فشرده و كممصرف در نظر گرفته شده بودند و به همين دليل عملكرد نسبتا پايين را با حوزههاي كاربرد بسيار محدود ارايه ميكردند. كاملا واضح است كه AMD براي آنكه بتواند مفهوم Fusion را به يك پذيرش جهاني برساند، به پلتفرمها و پردازندههاي عمومي بيشتري با سطح عملكرد مناسب در اين بازار نياز دارد. بنابراين، AMD پس از Brazos دو پلتفرم جديد Fusion را معرفي كرد: Sabine موبايل و Lynx دسكتاپ. هر دو پلتفرم مذكور مبتني بر پردازندههاي جديد سري A هستند كه با اسم رمز Llano شناخته ميشوند. قرار است Llano يكي از مدافعان اصلي شهرت Fusion در بازار پردازندههاي عمومي باشد.اجازه بدهيد نگاه دقيقتري به اولين پردازندههاي Llano انداخته و ببينيم آيا ما همانقدر كه AMD پافشاري ميكند به يك معماري پيوندي انقلابي نياز داريم يا خير.
درون Llano
از سوي ديگر، با وجود آنكه Llano دومين پردازنده در خانواده Fusion بهشمار ميآيد، اما ساختار كلي اين پردازنده تنها نكته جديد درباره آن است. بهعبارت ديگر، كل APU جديد صرفا با استفاده از مولفههاي قديمي و با حداقل نوآوري تركيب شده است. اگر قرار بود اين محصول جديد را بدون بحث عميق در مورد ويژگيهاي آن توصيف كنيم، ميتوانستيم بگوييم كه Llano تركيبي از يك پردازنده Athlon II X4، هسته گرافيكي Radeon HD 5570 و چيپست AMD 870 است كه در داخل يك بستهبندي مشترك روي يك die نيمههادي واحد قرار گرفتهاند. البته اين توضيح كاملا نسبي است زيرا پردازنده جديد Llano از نوآوريهاي محدود و پيادهسازيهاي فني منحصربهفردي را نيز به همراه دارد، اما بهطور كلي هيچ نكته جديدي در اين APU به چشم نميخورد.
هسته پردازنده Husky
در عين حال، مهندسين AMD تلاش كردهاند تا ريزمعماري جديد خود را از بعضي جنبهها نوسازي كرده و عملكرد هستههاي Husky را حداقل نسبت به هستههاي داخل پردازندههاي Athlon II و Phenom II بهبود بخشند. واقعيت اين است كه دستيابي به اين هدف بسيار آسان بوده: صرفا با افزايش حافظه كاشه L2. به اين ترتيب، اكنون هر يك از هستههاي Llano به يك كاشه L2 يك مگابايتي مخصوص خودش مجهز شده. با اينحال، پردازنده جديد مطلقا فاقد كاشه L3 اشتراكي خواهد بود و به همين دليل مجموعه اندازه حافظه كاشه آن بر اساس استانداردهاي امروزي چندان بزرگ به نظر نميرسد.گذشته از افزايش كاشه، هستههاي Husky داراي يك واحد پيشبيني انشعاب بهبود يافته و بافرهاي اصلي بهينهسازي شده هستند: بافر بازچيني دستورالعملها اكنون 20 درصد بزرگتر شده و اندازه بافرهاي Load/Store نيز تا دو برابر افزايش پيدا كرده. بهعلاوه، Husky داراي يك مقسم (Divider) سختافزاري جداگانه است كه عمليات متناظر با آن را شتابدهي خواهد كرد. همانطور كه ميبينيد، تغييرات چنداني در ساختار پردازنده اعمال نشده است. پايه معماري K10 كاملا بدون تغيير باقي مانده و به همين دليل است كه Husky نميتواند چيزي بيش از 3 دستورالعمل را در هر سيكل كلاك خود پردازش كند (درست مثل تمام هستههاي قبلي).
معماري بهينهسازي شده STARS
هسته گرافيكي Sumo
تغييراتي كه در بالا به آنها اشاره كرديم، به AMD امكان ميدهند تا از يك نام بازاري سري 6000 براي هسته گرافيكي Sumo خود استفاده كند. بنابراين بر حسب تعداد پردازندههاي جريان داخلي، Llano ميتواند به يك Radeon HD 6550D يا Radeon HD 6530D مجهز شده باشد.وجود يك معادل مجتمع از كارت گرافيكي Radeon 5570 ميتواند ويژگي وسوسهانگيزي باشد، اما براي همه مناسب نخواهد بود. بنابراين AMD امكان ارتقاي شتابدهنده داخلي APU خود با بهرهگيري از فناوري CrossFire را فراهم كرده است. در اين حالت، فناوري مذكور تحت عنوان Dual Graphics شناخته ميشود و امكان تركيب GPU مجتمع با يك كارت گرافيكي Radeon الحاقي را براي ايجاد يك پيكربندي نامتقارن CrossFire بهوجود ميآورد.
اين فناوري واقعا تاثيرگذار است زيرا يك سيستم Dual Graphics ميتواند يك كارت گرافيكي از هر نوعي را بپذيرد. با اينحال، اين تنوعپذيري با مشكلاتي نيز همراه خواهد بود. پيش از هر چيز، شما تنها در صورتي ميتوانيد عملكرد گرافيكي خود را بهبود بخشيد كه شتابدهنده الحاقي بيش از دو برابر سريعتر از هسته Sumo مجتمع APU مورد استفادهتان نباشد. بهعبارت ديگر، اگر يك Radeon HD 6850 داشته باشيد، استفاده از آن بهعنوان يك كارت الحاقي مستقل و غيرفعال كردن هسته گرافيكي مجتمع بهطور كامل، بسيار منطقيتر به نظر ميرسد. محدوديت دوم حتي از اين نيز جديتر است. حالتهاي نامتقارن CrossFire تنها در DirectX 10/11 كار ميكنند و به همين دليل Dual Graphics در بازيهاي مبتني بر DirectX 9 يا OpenGL نه تنها هيچ مزيتي را به همراه نخواهد داشت، بلكه عملكرد تا سطح كندترين GPU سيستم تنزل خواهد كرد. با اينحال، Dual Graphics يك شيوه عالي براي صرفهجويي در هزينهها را در اختيار كاربران قرار ميدهد كه باعث ميشود Llano به يك گزينه فوقالعاده براي سيستمهاي بازي سطح پايين تبديل گردد.
پل شمالي
هسته گرافيكي بهوضوح به پهناي باند بالايي از گذرگاه حافظه نياز دارد. حتي خود AMD نيز به اين نكته اشاره ميكند كه استفاده از حافظه DDR3-1333 ميتواند عملكرد هسته گرافيكي مجتمع را بهطور چشمگيري كاهش دهد. با اينحال، پشتيباني از حافظه سريع بهعنوان خصوصيت اصلي پل شمالي در نظر گرفته نميشود. نكته بسيار جالبتر درباره اين پل شمالي، مسيرهاي داده جديد آن هستند كه عملكرد مولفههاي گرافيكي APU را بهينهسازي ميكنند. در كنار لينك سنتي مابين CPU و پل شمالي، Llano داراي دو اتصال گذرگاه اضافي مابين GPU و پل شمالي خود است.اتصال اول كه تحت عنوان Radeon Memory Bus شناخته ميشود، براي كاربردهاي گرافيكي عمومي مورد استفاده قرار ميگيرد. پهناي باند اين گذرگاه معادل 29,8 گيگابيت بر ثانيه است كه مشابه نرخ انتقال داده حافظههاي DDR3-1866 خواهد بود. درخواستهاي حافظهاي كه از اين گذرگاه عبور ميكنند داراي بالاترين اولويت هستند و كنترلر حافظه آنها را حتي پيش از درخواستهاي پردازنده پاسخ ميدهد.
پلتفرمهاي پشتيباني كننده از Llano
پردازندههاي Llano
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb
/ج
مقالات مرتبط
تازه های مقالات
ارسال نظر
در ارسال نظر شما خطایی رخ داده است
کاربر گرامی، ضمن تشکر از شما نظر شما با موفقیت ثبت گردید. و پس از تائید در فهرست نظرات نمایش داده می شود
نام :
ایمیل :
نظرات کاربران
{{Fullname}} {{Creationdate}}
{{Body}}